AI资讯新闻榜单内容搜索-Diffusion

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Diffusion
CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

CityDreamer4D: 下一个世界模型,何必是视频生成模型?

在过去的两年里,城市场景生成技术迎来了飞速发展,一个全新的概念 ——世界模型(World Model)也随之崛起。当前的世界模型大多依赖 Video Diffusion Models(视频扩散模型)强大的生成能力,在城市场景合成方面取得了令人瞩目的突破。然而,这些方法始终面临一个关键挑战:如何在视频生成过程中保持多视角一致性?

来自主题: AI技术研报
5019 点击    2025-01-28 11:53
生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

生成越长越跑偏?浙大商汤新作StarGen让场景视频生成告别「短片魔咒」

本文介绍了一篇由浙江大学章国锋教授和商汤科技研究团队联合撰写的论文《StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation》。

来自主题: AI技术研报
7184 点击    2025-01-17 11:14
终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

终于等来能塞进手机的文生图模型!十分之一体量,SnapGen实现百分百的效果

近些年来,以 Stable Diffusion 为代表的扩散模型为文生图(T2I)任务树立了新的标准,PixArt,LUMINA,Hunyuan-DiT 以及 Sana 等工作进一步提高了图像生成的质量和效率。然而,目前的这些文生图(T2I)扩散模型受限于模型尺寸和运行时间,仍然很难直接部署到移动设备上。

来自主题: AI技术研报
6721 点击    2024-12-25 14:02
在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

在线试玩 | 对齐、生成效果大增,文本驱动的风格转换迎来进阶版

近年来,随着 Stable Diffusion 等文本到图像生成模型的发展,这些技术使得在保留内容准确性的同时,实现出色的风格转换成为可能。这项技术在数字绘画、广告和游戏设计等领域具有重要的应用价值。

来自主题: AI技术研报
7103 点击    2024-12-19 15:34
更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

更懂中文还兼顾SD生态,360开源文生图模型结构,寡姐秒变中国新娘 | AAAI

具备原生中文理解能力,还兼容Stable Diffusion生态。 最新模型结构Bridge Diffusion Model来了。 与Dreambooth模型结合,它生成的穿中式婚礼礼服的歪国明星长这样。

来自主题: AI资讯
6401 点击    2024-12-19 10:08
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成

近年来,扩散模型(Diffusion Models)已成为生成模型领域的研究前沿,它们在图像生成、视频生成、分子设计、音频生成等众多领域展现出强大的能力。

来自主题: AI技术研报
6005 点击    2024-12-05 11:49
ComfyUI重磅更新:桌面版正式发布,支持win和mac,彻底告别繁琐的安装配置

ComfyUI重磅更新:桌面版正式发布,支持win和mac,彻底告别繁琐的安装配置

ComfyUI重磅更新:桌面版正式发布,支持win和mac,彻底告别繁琐的安装配置

新手使用 ComfyUI 最大的问题终于被官方解决了!Comfy推出跨平台的 ComfyUI 安装包,你现在可以一键安装 ComfyUI 了。ComfyUI 是一个强大的、基于节点的、用于 Stable Diffusion 的图形用户界面 (GUI)。它允许用户以高度可定制和灵活的方式创建和执行复杂的图像生成工作流程。

来自主题: AI资讯
7764 点击    2024-12-03 11:19
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,照样能跑酷

如今,机器人学习最大的瓶颈是缺乏数据。与图片和文字相比,机器人的学习数据非常稀少。目前机器人学科的主流方向是通过扩大真实世界中的数据收集来尝试实现通用具身智能,但是和其他的基础模型,比如初版的 StableDiffusion 相比,即使是 pi 的数据都会少七八个数量级。

来自主题: AI技术研报
7277 点击    2024-11-18 09:14
Stability AI出官方教程了,带你轻松玩转Stable Diffusion 3.5

Stability AI出官方教程了,带你轻松玩转Stable Diffusion 3.5

Stability AI出官方教程了,带你轻松玩转Stable Diffusion 3.5

今日凌晨,Stability AI 发布了 Stable Diffusion 3.5 的提示指南。该指南提供了 Stable Diffusion 3.5 的实用提示技巧,让使用者能够快速准确地完善图像概念,更好地使用 Stable Diffusion 3.5 这一在可定制性、高效性能、多样化输出和多功能风格方面均表现出色的模型。

来自主题: AI资讯
6824 点击    2024-11-14 15:06
NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

扩散模型(Diffusion Models, DMs)已经成为文本到图像生成领域的核心技术之一。凭借其卓越的性能,这些模型可以生成高质量的图像,广泛应用于各类创作场景,如艺术设计、广告生成等。

来自主题: AI技术研报
7400 点击    2024-10-27 16:39